% Version control information:
%$HeadURL: http://practicas-statgraphics.googlecode.com/svn/trunk/regresion_no_lineal/regresion_no_lineal.tex $
%$LastChangedDate: 2009-10-26 19:27:03 +0000 (Mon, 26 Oct 2009) $
%$LastChangedRevision: 10 $
%$LastChangedBy: asalber $
%$Id: regresion_no_lineal.tex 10 2009-10-26 19:27:03Z asalber $

\chapter{Regresión no lineal}

\section{Fundamentos teóricos}
La regresión simple tiene por objeto la construcción de un modelo
funcional $y=f(x)$ que explique lo mejor posible la relación entre
dos variables $Y$ (variable dependiente) y $X$ (variable
independiente) medidas en una misma muestra.

Ya vimos que, dependiendo de la forma de esta función, existen muchos tipos de regresión simple. Entre los más habituales están:
\begin{center}
\begin{tabular}{|l|c|}
\hline
 Tipo de modelo      &     Ecuación genérica      \\
\hline\hline
 Lineal                  &          $y=a+bx$          \\
\hline
 Parabólico              &       $y=a+bx+cx^2$        \\
\hline
 Polinómico de grado $n$ & $y=a_0+a_1x+\cdots+a_nx^n$ \\
\hline
 Potencial               &       $y=ax^b$       \\
\hline
 Exponencial             &     $y=ca^{bx}$      \\
\hline
 Logarítmico             &       $y=c\log_abx$        \\
\hline
\end{tabular}
\end{center}

La elección de un tipo de modelo u otro suele hacerse según la forma
de la nube de puntos del diagrama de dispersión. A veces estará
claro qué tipo de modelo se debe construir, tal y como ocurre en los
diagramas de dispersión de la figura~\ref{g:tiposrelaciones2}. Pero
otras veces no estará tan claro, y en estas ocasiones, lo normal es
ajustar los dos o tres modelos que nos parezcan más convincentes,
para luego quedarnos con el que mejor explique la relación entre $Y$
y $X$, mirando el coeficiente de determinación\footnote{Ver la
práctica de correlación.} de cada modelo.

\begin{figure}[h!]
\centering 
\subfigure[Sin relación.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_sin_relacion}}}\qquad
\subfigure[Relación lineal.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_lineal}}}\qquad
\subfigure[Relación polinómica.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_parabolica}}}\\
\subfigure[Relación exponencial.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_exponencial}}}\qquad
\subfigure[Relación logarítmica.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_logaritmica}}}\qquad
\subfigure[Relación inversa.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_inversa}}}\\
\caption{Diagramas de dispersión correspondientes a distintos tipos de relaciones
entre variables.} \label{g:tiposrelaciones2}
\end{figure}

Ya vimos en la práctica sobre regresión lineal simple, cómo
construir rectas de regresión. En el caso de que optemos por ajustar
un modelo no lineal, la construcción del mismo puede realizarse
siguiendo los mismos pasos que en el caso lineal. Básicamente se
trata de determinar los parámetros del modelo que minimizan la suma
de los cuadrados de los residuos en $Y$. En los modelos
multiplicativo y exponencial, el sistema aplica transformaciones
logarítmicas a las variables y después ajusta un modelo lineal a los
datos transformados. En el modelo recíproco, el sistema sustituye la
variable dependiente por su recíproco antes de estimar la ecuación
de regresión.

\clearpage
\newpage


\section{Ejercicios prácticos}
\begin{enumerate}[leftmargin=*]

\item En un experimento se ha medido el número de bacterias por unidad de volumen en un cultivo, cada hora transcurrida, obteniendo los siguientes resultados:
\begin{center}
\begin{tabular}{c|ccccccccc}
Horas & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8  \\
\hline
N$^0$ Bacterias & 25 & 28 & 47 & 65 & 86 & 121 & 190 & 290 & 362
\end{tabular}
\end{center}

Se pide:

\begin{enumerate}
\item  Crear las variables \variable{horas} y \variable{bacterias} e introducir estos datos.

\item  Dibujar el diagrama de dispersión correspondiente. En vista del diagrama, ¿qué tipo de modelo
crees que explicará mejor la relación entre el número de bacterias y el tiempo transcurrido?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Graficar->Gráficos de Dispersión->Gráfico X-Y}.
\item Seleccionar la variable \variable{bacterias} en el campo \texttt{Y} y la variable \variable{horas}
en el campo \texttt{X}.
\end{enumerate}}
\end{indicacion}

\item Hacer una comparativa de los distintos modelos de regresión en función del coeficiente de determinación.
¿Qué tipo de modelo es el mejor?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Relacionar->Un Factor->Regresión Simple}.
\item Seleccionar la variable \variable{bacterias} en el campo \texttt{Y} y la variable \variable{horas}
en el campo \texttt{X}.
\item Hacer click en el botón \boton{Tablas} y activar la casilla \opcion{Comparación de Modelos
Alternativos}, con lo que aparecen los distintos modelos ordenados
según el valor del coeficiente de determinación (R-cuadrada). El
modelo que tenga el mayor coeficiente de determinación será el
mejor.
\end{enumerate}}
\end{indicacion}
\item En  vista de lo anterior, calcular el modelo de regresión que mejor explique la relación
entre \variable{bacterias} y \variable{horas}.
\begin{indicacion}{
\begin{enumerate}
\item En la ventana de resultados del apartado anterior hacer click en el botón \boton{Tablas} y
activar la casilla \opcion{Resumen del Análisis}.
\item Hacer click con el botón derecho del ratón sobre los resultados obtenidos y
seleccionar \opcion{Opciones de Análisis}.
\item Seleccionar el tipo de modelo deseado, con lo que se obtiene la ecuación de dicho modelo.
\end{enumerate}}
\end{indicacion}

\item Según el modelo anterior, ¿cuántas bacterias habrá al cabo de 3 horas y media del inicio del cultivo?
¿Y al cabo de 10 horas? ¿Son fiables estas predicciones?
\begin{indicacion}{
\begin{enumerate}
\item En la ventana de resultados del apartado anterior hacer click en el botón \boton{Tablas}
y activar la casilla \opcion{Pronósticos}.
\item Hacer click con el botón derecho del ratón sobre los resultados obtenidos y seleccionar \opcion{Opciones de Ventana}.
\item Introducir los valores para los que se quiere hacer las predicciones en \texttt{Pronóstico en X}.
\item Una predicción es fiable si el coeficiente de determinación es
próximo a $1$ y el valor para el que se realiza está próximo a los
datos disponibles, por lo que en nuestro caso, la predicción para 3
horas y media será más fiable que la predicción para 10 horas
\end{enumerate}}
\end{indicacion}

\item Dar una predicción lo más fiable posible del tiempo que tendría que transcurrir para que en el
cultivo hubiese 100 bacterias.
\begin{indicacion}{
Repetir los pasos del apartado anterior pero seleccionando la
variable \variable{horas} en el campo \texttt{Y} y la variable
\variable{bacterias} en el campo \texttt{X}, y cambiando el tipo de
modelo si es necesario.}
\end{indicacion}
\end{enumerate}

\item Se han medido dos variables $S$ y $T$ en 10 individuos,
obteniéndose los siguientes resultados:
\begin{center}
$(-1.5,\ 2.25),\ (0.8,\ 0.64),\ (-0.2,\ 0.04),\ (-0.8,\ 0.64),\ (0.4,\ 0.16)$\\
$(0.2,\ 0.04),\ (-2.1,\ 4.41),\ (-0.4,\ 0.16),\ (1.5,\ 2.25),\
(2.1,\ 4.41)$
\end{center}
Se pide:
\begin{enumerate}

\item  Crear las variables \variable{S} y \variable{T} e introducir estos datos.

\item Calcular la recta de regresión de \variable{T} sobre \variable{S} y dibujarla sobre el diagrama de
dispersión. ¿Podemos afirmar que \variable{T} y \variable{S} son
independientes? ¿Qué tipo de relación existe entre \variable{T} y
\variable{S}?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Relacionar->Un Factor->Regresión Simple}.
\item Seleccionar la variable \variable{T} en el campo \texttt{Y} y la variable \variable{S} en el campo \texttt{X}.
\item Para obtener la ecuación del modelo lineal hacer click en el botón \boton{Tablas} y activar
la casilla \opcion{Resumen del Análisis}.
\item Para dibujar el modelo lineal hacer click en el botón \boton{Gráficas} y activar la
casilla \opcion{Gráfico del Modelo Ajustado}.
\item El coeficiente de determinación (R-cuadrada) es cero. Esto
quiere decir que no hay relación lineal entre las variables, pero no
excluye que pueda haber otro tipo de relación entre ellas, por lo
que no puede afirmarse que sean independientes.
\item En el diagrama de dispersión se observa que los puntos están
colocados en forma de parábola.
\end{enumerate}}
\end{indicacion}

\item En vista de lo anterior, ajustar un modelo de regresión polinómico de grado 2. ¿Es un buen modelo?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Relacionar->Un Factor->Regresión Polinomial}.
\item Seleccionar la variable \variable{T} en el campo \texttt{Y} y la variable \variable{S} en el campo \texttt{X}.
\item Hacer click en el botón \boton{Tablas} y activar la casilla \opcion{Resumen del Análisis}.
\item Hacer click con el botón derecho del ratón sobre los resultados obtenidos y seleccionar \opcion{Opciones de Análisis}.
\item Introducir el grado del modelo polinómico en el campo \texttt{Orden}, con lo que se obtiene
la ecuación del modelo polinómico de grado 2 que mejor expresa la
relación de \variable{T} en función de \variable{S}.
\item El coeficiente de determinación (R-cuadrada) es 1, por lo que
e l modelo es perfecto ya que existe dependencia funcional.
\end{enumerate}}
\end{indicacion}
\end{enumerate}

\end{enumerate}


\section{Problemas}
\begin{enumerate}[leftmargin=*]
\item En un centro dietético se está probando una nueva dieta de adelgazamiento en una
muestra de 12 individuos. Para cada uno de ellos se ha medido el número de días que
lleva con la dieta y el número de kilos perdidos desde entonces, obteniéndose los
siguientes resultados:
\begin{center}
$(33,\ 3.9),\ (51,\ 5.9),\ (30,\ 3.2),\ (55,\ 6.0),\ (38,\ 4.9),(62,\ 6.2)$\\
$(35,\ 4.5),\ (60,\ 6.1),\ (44,\ 5.6),\ (69,\ 6.2),\ (47,\ 5.8),\
(40,\ 5.3)$
\end{center}
Se pide:
\begin{enumerate}
  \item Dibujar el diagrama de dispersión. Según la nube de puntos, ¿qué tipo de
  modelo explicaría mejor la relación entre los kilos perdidos y los días de dieta?
  \item Construir el modelo de regresión que mejor explique la relación entre los kilos perdidos y los días de dieta.
  \item Utilizar el modelo construido para predecir el número de kilos perdidos tras 40
  días de dieta y tras 100 días. ¿Son fiables estas predicciones?
\end{enumerate}

\item Los ingresos por ventas de una empresa (en millones de euros) en los últimos años aparecen en la siguiente tabla:
\begin{center}
\begin{tabular}{|c|ccccccccccc|}
\hline
  Año   & 1995 & 1996 & 1997 & 1998 & 1999 & 2000 & 2001 & 2002 & 2003 & 2004 & 2005 \\
\hline
 Ventas & 20 &  25  &  32  &  38  &  38  &  48  &  52  &  56  &  68  &  90  & 100  \\
\hline
\end{tabular}
\end{center}

Se pide:
\begin{enumerate}
\item Dibujar el diagrama de dispersión. ¿Qué tipo de relación existe entre las ventas y los años?

\item Construir y dibujar el modelo de regresión que mejor explique la relación entre las ventas y los años.

\item Según este modelo, ¿cuáles serán los ingresos por ventas esperados para el año 2006? ¿Es fiable la predicción?
\end{enumerate}

\end{enumerate}